{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "import malaya\n",
    "\n",
    "malays = malaya.texts._malay_words._malay_words"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": [
    "import re\n",
    "from unidecode import unidecode\n",
    "\n",
    "def cleaning(string):\n",
    "    string = unidecode(string).replace('.', '. ').replace(',', ' , ')\n",
    "    string = re.sub('[^\\'\"A-Za-z\\-/ ]+', ' ', string)\n",
    "    string = re.sub(r'[ ]+', ' ', string.lower()).strip()\n",
    "    return string"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [],
   "source": [
    "# http://ilovepahang.blogspot.com/p/kamus.html\n",
    "\n",
    "additional = \"\"\"\n",
    "Ace - awalan pada beberapa perbuatan..seperti..awok ace cuba dulu/sama dgn ce\n",
    "Aok - awak\n",
    "Aokme/Awokme - kalian, anda semua\n",
    "Ampuh - tenggelam\n",
    "\n",
    "B\n",
    "Babir - degil\n",
    "Baler - gila, bala?\n",
    "Beter - betul (Lipis/Raub)\n",
    "Berderau - gotong royong\n",
    "Bederun - pergi beramai-ramai\n",
    "Bejehek - macam tak habis, tak selesai\n",
    "Bejejet - peluh yang mencurah-curah\n",
    "Bahan - pukul (Contoh: bahan kuat sket..bior mampuih.)\n",
    "Berlengging - tak pakai baju, pakai seluar sahaja\n",
    "Berlemin - berminyak\n",
    "Berlimbor - berjalan bergandingan, berdua-duaan, jalan bersebelahan\n",
    "Biroh - gatal, miang, gedik\n",
    "Buas - lasak\n",
    "Buboh - letak\n",
    "Boyaih - boroi\n",
    "Berambi - berhati-hati,berwaspada\n",
    "Borok - borak\n",
    "Bobok - tipu, bohong (pedo'oh)\n",
    "Bopeng - pokai, tak ada duit\n",
    "Boleng/bole/boleir - telanjang bulat\n",
    "Berte’eih - bertungkus-lumus,usaha gigih\n",
    "Beraluih/beralus - perangai yang sopan santun,berbudi bahasa (Contoh: mak suka benor ngan si tipah tu..beralus budaknya)\n",
    "Bela - repair (Contoh: Bila aok nok bela TV tu?)\n",
    "Berjelobei - koyak rabak, serabai\n",
    "Beringor - memberitahu\n",
    "Bersalai - disebut bersalei- maksud : tak mandi pagi\n",
    "Berahi - suka (lebih kpd barang ye bukan org…kekkeke…disebut)\n",
    "Bergodok - menghentak kaki ke batang lesung secara bersama/serentak serta dengan kadar yang cepat masa mengempin\n",
    "Bertonyeh - gaduh mulut\n",
    "Bercemperidei - berlari dengan cepat, berterabur\n",
    "Bersempudei - berserabai, terbarai, bertepek dgn kotoran\n",
    "Bekeroh - berdengkur\n",
    "\n",
    "C\n",
    "Ce - awalan pada beberapa perbuatan..seperti..awok ce cuba dulu\n",
    "Caiyor - melilau, tercari-cari\n",
    "Cegeng - capang (telinga)\n",
    "Cemuih - bosan\n",
    "Cenekang - cekam, cagu\n",
    "Cekut - cakap/beritahu\n",
    "Celau - hari ribut..sebab melakukan sesuatu luar biasa/tabie..seperti laga kucing\n",
    "Cengkelik - hampir-hampir lemas, tersedak, tak boleh bernafas\n",
    "Chika - mual/muntah/perut memulas\n",
    "Cipot (mencipot) - lari lintang-pukang (Cth : mencipot lari kejor de anjing)\n",
    "Cokei - cukai\n",
    "Cokeng - tegak\n",
    "Congkeh - cungkil (Cth : Habat het aok ni.. congkeh gigi ngan jari...)\n",
    "Cuok (cuak) - takut\n",
    "Cakner (cakna) -tak amek peduli, tak kisah. (Contoh: sebab pagi tadi aku lupa gi keja gosok baju.. lalu mak aku kata bebudak sekarang ni tok cakne langsung)\n",
    "Copeir - hampir-hampir jatuh\n",
    "Condeir - duduk di hujung birai (hampir sama dgn copeir)\n",
    "\n",
    "D\n",
    "Dan - sempat (Contoh: la napenye tok makan lagi? Tok dan ker?)\n",
    "Di - Awak (Kata gantinama kedua) biasa digunakan di Pulau Tawar, Jerantut.\n",
    "Doh - sudah (Contoh : awok doh makan ker?)\n",
    "Dema - awak,biasanya utk ramai (Contoh: dema ni takde keja lain ke)\n",
    "Dimeh - sama macam Dema - biasa digunakan di belah Raub.\n",
    "Daur - sebaya,berkaitan dgn usia\n",
    "Dedor - suam-suam kuku\n",
    "Dedeh - hiris, potong\n",
    "\n",
    "G\n",
    "Gon - awak semua (Cth : Mana gon nok pegi ni?) (biasa diguna di Ulu Tembeling)\n",
    "Gohek - kayuh\n",
    "Goner - macamana, bagaimana, guane(Kltn/Trg)\n",
    "Godei - kacau kacau air, dodol\n",
    "Goge - hingar bingar\n",
    "Gebor - selimut\n",
    "Gonyoh - Sental kuat2\n",
    "Getik - geli,meluat\n",
    "Genyot - lembek (Cth : Aok rebus ubi tu sampei genyot)\n",
    "Gamoknye - agaknya\n",
    "Gasok - suka hati awaklah\n",
    "Garaih/garas - gosok dengan kasar, cuci dengan berus\n",
    "Gampang - kata cacian, makian (nada gurauan)\n",
    "Gonggot - rambut yang digunting tak sekata\n",
    "Ghober - terlalu teruk\n",
    "\n",
    "H\n",
    "Habat/habad - pengotor\n",
    "Hamlor/Hamlau - riang\n",
    "Halkoh - kain baju, pakaian, barang2 peribadi\n",
    "Hantoi - lembap,slow pergerakan\n",
    "Hampuras - paling tak berguna, teruk, hampeh (maki hamun)\n",
    "Hamun - bosan, benci\n",
    "\n",
    "J\n",
    "Jabir - beg plastik\n",
    "Jenih - jenis\n",
    "Jenuh - puas (Contoh: ntoh ler..jenuh dah koi nunggu)\n",
    "Juwei - dahan pokok yang yang mencecah permukaan sungai\n",
    "Julat - tolak\n",
    "Juring - potong, hiris (Cth : Aok mkn buoh mangga ke ter? Bok keh sejuring...)\n",
    "Jelun/Jelong - biasanya kalau demam ambil tuala.celup ngan air asam jawa. jelun kepala\n",
    "\n",
    "K\n",
    "Kwei(Kawan) - saya, aku (biasa digunakan di Pekan)\n",
    "Kaih/Kah/Kash/Kaweh - saya, aku (biasa digunakan di Jerantut)\n",
    "Keh -saya,aku (biasa digunakan di Lipis/Raub)\n",
    "Koi - saya,aku (biasa digunakan di Temerloh)\n",
    "Kantup - tutup\n",
    "Kancut - pakaian\n",
    "Kair - ke air (maksudnya - pergi ke sungai; mengail, menjala dsb)\n",
    "Kabir - panggil, lambai, juga salah satu cara untuk mendayung perahu\n",
    "Kome - kami\n",
    "Kulo - warna kelabu tahi anjing\n",
    "Kupi - Tin\n",
    "Kohoit - letih, lenguh, sengal\n",
    "Kerang - menangis dengan sepenuh hati, ketawa hingga tak boleh bernafas\n",
    "Keri - ketawa teramat sangat.gelak guling-guling/gembira tak terperi\n",
    "Kupik - kedekut\n",
    "Kerapoh - sisa2/bersepah (Contoh: Boh ke kawan kerapoh tulang2 ikan tu yek)\n",
    "Kecah - Lecak, becak\n",
    "Karang - nanti,sebentar lagi (Contoh: karang lah mok koi kupas nyour tu)\n",
    "Kelat - tipu bukan kelat buah (Contoh: tak aci sungguh main kelat) bunyi 'e' spt cerek\n",
    "Kememe - sama cam tembe gak\n",
    "Kekalu - emping dibuat dari padi pulut\n",
    "Komeng - sinonim ngan nyiur/kelapa\n",
    "Kuit/menguit - biase nye menunjukkan sesuatu yang banyak/ramai\n",
    "Komoih - Gomol. (Contoh: Jgn le komoih budak tu nak tido weh)\n",
    "Kobek/kerobek - membelek-belek, menyiasat\n",
    "Kepok - tempat simpan padi\n",
    "Kehem - berkehem, bersungguh-sungguh/keterlaluan\n",
    "Kodi/kudi? - ketinggalan zaman\n",
    "Kode - kacau (air)\n",
    "Kipong/kepong - Makan buah spt jambu, mempelam tanpa menghiris, kekah\n",
    "Keknya - tetapi\n",
    "Ketnyer - walaubagaimanapun\n",
    "Kipai - letih /lenguh tangan\n",
    "Kisok - kelam-kabut\n",
    "Kenit - kecil\n",
    "Kederat - upaya\n",
    "Kerayan - takut, cemas, bimbang (biasa digunakan di Jerantut)\n",
    "Kanyo/konyo - riak wajah, bera, muka tebal\n",
    "\n",
    "L\n",
    "Lat - tenggang/jarak masa\n",
    "Latur - pijak, lanyak, kerap dilalui (Cth : Habih belubang jalan ni latur de lori...)\n",
    "Lagung - langgar, hantuk kepala ke dinding\n",
    "Lantak - suka hati awak\n",
    "Lambo - beranda rumah\n",
    "Lacuh - tempat yang banyak dilalui atau digunakan\n",
    "Lehet - dipakai bagi bagi buah labu, melekit\n",
    "Lece - Tilam\n",
    "Lengit - kalah teruk\n",
    "Linyo - licin, bersih (Cth : Weh, pasei linyo je muke aok? Pakei susuk ke botox?)\n",
    "Ledot/ledoit - pekat\n",
    "Lede - cuai/tidak berhati-hati/sambil lewa\n",
    "Lejut - basah teruk(lencun)\n",
    "Lepe - cuai\n",
    "Lecoh - becak\n",
    "Leweh - lemah longlai (cakap atau utk perbuatan)\n",
    "Lawas - lapang, kawasan yang luas\n",
    "Lembang (berlembang) - sepah, berterabur\n",
    "Loghat (lorat) - kalut, nak cepat\n",
    "Lodek - lumpur\n",
    "Lopok - bekas untuk menyimpan sesuatu (Cth : lopok pensel)\n",
    "Lempoy (belempoy) - perihal kain yang bergumpal, berperenyuk\n",
    "Lempat - perihal kain yang terbiar di atas lantai, biasanya kain basahan\n",
    "\n",
    "M\n",
    "Moh - jom,mari\n",
    "Mok - mak\n",
    "Muyaih - kotor, serabut\n",
    "Mengelice - mengelupur\n",
    "Mantul - pening-pening\n",
    "Menikei/kenikei - buah tembikai\n",
    "Meleweh - bercakap mcm nak tak nak\n",
    "Meling - lalai, cuai\n",
    "Mereloh - tidur (Temerloh, Jerantut, Raub, Lipis)\n",
    "Meghetoh - tidur - sda-\n",
    "Mengedam - tido (Pekan)\n",
    "Meronoh - buang air besar\n",
    "Meghuoh (meruah) - kentut dengan aroma paling hampuras sekali\n",
    "Membeser - buang air kecil\n",
    "Membute - tido\n",
    "Mencayak - laju sangat (biasanya merempit)\n",
    "Mengelentat - mengada2 seksi\n",
    "Mengelatat - mengelicai\n",
    "Memetat - terkena kpd diri sendiri\n",
    "Merohong - wangi sangat\n",
    "Melantong - busuk sangat\n",
    "Merebang/mengerebang - rambut tak terurus\n",
    "Merening - benda yang nak pecah(bulat)\n",
    "Meraban - tak tentu hala, merepek, melalut\n",
    "Menginding - mengecek makanan, kita dekati pihak lain secara diam-diam, juga bermaksud berdampingan\n",
    "Mengkelan - tercekik (berkaitan dengan makan)\n",
    "Mengkone - kemana-mana\n",
    "Merarau - aktiviti berkatan menangkap ikan\n",
    "Menggeledeng - perihal pergerakan badan.(Cth : Bakper menggeledeng ngat ni?)\n",
    "Menglekek - ketawa beria-ia, terkekeh-kekeh\n",
    "Masam menaung - Masam Sesangat\n",
    "Masam mencekut - masam sesangat\n",
    "Merepih - mencangkul rumput\n",
    "Mengopeh - suka pegang sana..pegang sini..tangan tak duduk diam\n",
    "Merepau -jalan dalam hutan tanpa tujuan\n",
    "Melengger - apa ye perkataan sesuai.contohnya perahu yang hampir nak dimasuki air\n",
    "Merabung -kuantiti yang banyak.nasi sepingan rabung\n",
    "Mengoteh, meroteh - tangan tak dok diam\n",
    "Melukah - kain yang dipakai terbuka\n",
    "Menganjing - mengada\n",
    "Motong - menoreh getah\n",
    "Mamai - mimpi di siang hari, fikiran tidak stabil\n",
    "Manis meleting - teramat manis\n",
    "Mengekot - tubuh berbaring dengan bengkok..ala cam asam gelugur kedudukanya.\n",
    "Mengaran,menajau - menangkap ikan dengan cacak tiang tgh sungai ikat tangsi dan mata kail, untuk pemberatnya diikat batu atau botol.\n",
    "Merawei - satu lagi cara menangkap ikan.\n",
    "Mengoloh - tolak balik/undur\n",
    "Mencelabak - benda jatuh dalam jumlah yang banyak atau berat\n",
    "Melepang - pahit/.masin/masam sangat\n",
    "Mencanak -laju sangat(mencayak?)\n",
    "Mek nye(matnya) - kenapanya\n",
    "Megok-megok - tiba-tiba, sekonyong-konyong\n",
    "Malaih - malas\n",
    "Mombong - penuh\n",
    "Meningkoh/tingkoh - membalas percakapan, menjawab, berdebat\n",
    "Mengkane - telekung sembahyang\n",
    "Mentekedaghoh (mentekedarah) - mentadarah, makan\n",
    "Melantok - makan juga\n",
    "Merungkeh/merungkaih - memanjat (terkial-kial)\n",
    "Merukeh/merukaih - tercari-cari, mengagau\n",
    "Molor - bekas, balang (biasanya diisi tempoyak/bekas gula2 di kedai runcit)\n",
    "\n",
    "N\n",
    "Nyayup - tinggi sangat diatas atau bawah sangat\n",
    "Nyuluh - operasi buru binatng hutan pada mlm hari\n",
    "Ngilir - menghala kehilir sungai.(dengan bot/perahu) secara perlahan.\n",
    "Ngercuk - ramai sangat (orang), penuh sesak\n",
    "Ngonyoh - gosok dengan kasar\n",
    "Nyeraya - suruh\n",
    "Nyonyeh - basah lejut\n",
    "\n",
    "O\n",
    "Oteing - pening lalat\n",
    "Ong - awak (biasa digunakan di jaluran Sungai Tembeling)\n",
    "Ogek - bergoyang, tidak kuat (Cth : Pasei kaki kerusi ni ogek? Taket keh nok duduk)\n",
    "\n",
    "P\n",
    "Pedo'oh - tipu\n",
    "Paluh - air sungai yang terkepung dek pasir (air tak mengalir)\n",
    "Pundung/safa - rumah kecik yang dibuat untuk berehat seperti tepi sawah,kebun durian dsb\n",
    "Pepalih - terlebih, over (Cth : Pepalih awok ngape buat gitu..)\n",
    "Podot/podok - sumbat (Cth: Usin, kalau tok muat jugek aok podot je la baju tu dlm beg ni)\n",
    "Perintan/perentan - keadaan, masa (Pktn asal Ing - 'Prime Time')\n",
    "Pelangkor - petir, guruh, kilat\n",
    "Polok - gelojoh\n",
    "Palor - Biar\n",
    "Pungkor - Bohong, tipu, pedo'oh\n",
    "Pepoh - pukul, hentam\n",
    "Pesuk - bocor, tembus\n",
    "\n",
    "R\n",
    "Rodong/ghodong - kengkawan, member, sahabat\n",
    "Racik - jerat ayam hutan\n",
    "Rhebas - hujan dah mula turun renyai2..\n",
    "Ralit - kusyuk, leka\n",
    "Rege - harga\n",
    "Reba - semak samun\n",
    "Rompong - kemek, berlubang (Cth : Rompong kete tu kang aok lagung ke tiang)\n",
    "Rengcek (ghengchek) - perihal bersembang, bising, hiruk pikuk\n",
    "Rengkok (ghengkok) - perihal ketawa beramai-ramai, riuh rendah\n",
    "\n",
    "S\n",
    "Sapan/sapai - habih sut/habih reng/selesai\n",
    "Sepan - tak berguna (macam hampuras)\n",
    "Sede - mudah, senang (Cth : Sede sgt soalan aok ni.. bagi la yg payoh sikik...)\n",
    "Sesemut - kebas kaki\n",
    "Sebobot - serabut\n",
    "Senyour - kebas kaki juga\n",
    "Seronyih - serabut, tak kemas, tak seperti keadaan asal\n",
    "Setotok - sama, sejenis (biasa digunakan di Daerah Pekan)\n",
    "Sangei - tudung saji\n",
    "Sengkelen - duit siling/pulas tangan kebelakang\n",
    "Sempelet - kotoran di badan\n",
    "Se’eh - Kenyang yg teramat sgt. (Cth : Se’ehnya perot kawan ni.rase macam tok leh nok bangun doh!)\n",
    "Sokmo - selalu (Cth:Sokmo nye aku yang kena buat..aok bila?)\n",
    "Setoho - di sana, situ ha..\n",
    "Seman - terkena badi/kenan (huruf 'e' disebut spt cerek)\n",
    "Sepolit - tinggal sedikit, secubit\n",
    "Sekeceng - tidor sekejap sangat\n",
    "Sokmo - selalu\n",
    "Sakat - kandas/tersekat pergerakan perahu/bot.dalam air dek kerana pasir, juga bermaksud mengacau, menganggu, mengusik..\n",
    "Sontok - habis had, suntuk\n",
    "Sigung - menyiku, belasah\n",
    "\n",
    "T\n",
    "Tatin - angkat jemuran\n",
    "Taki/bertaki - gaduh, berkelahi\n",
    "Timbuk - kacau (gulai)\n",
    "Taruk - letak\n",
    "Tutuh - mencantas dahan\n",
    "Tekeh - sekeh/ketuk/pukul dengan belakang gemgaman tangan.\n",
    "Tawor Hebe - Tawar Sesangat (Air)\n",
    "Tekeih - sikit lagi. tekeih dah no kena ikan tadi.(sikit lagi nak dapat tangkap ikan itu)\n",
    "Tohor - cetek (Contoh: lor..mek nya tohor ngat air sungei nie)\n",
    "Tertomos/tetomoih - jatuh tersembam, tersungkur\n",
    "Tembe - lembek, lemah, manja\n",
    "Tok - tidak (Contoh: tok makan lagi la..kawan lapo nie)\n",
    "Tebal bakut - sangat tebal ( bak kata org pahang ckp bahse KL tebal giler!)\n",
    "\n",
    "W\n",
    "Waber/baler/papalih - lebih kurang le makna tiga perkataan tu.\n",
    "Wokme - kalian, anda semua (aokme)\n",
    "Woreh - waris, kaum kerabat\n",
    "\n",
    "\n",
    "Z\n",
    "Zaman Tori - zaman dulu kala/ disebut zaman Tuk Adam\n",
    "\"\"\""
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {
    "scrolled": false
   },
   "outputs": [],
   "source": [
    "words = []\n",
    "for line in additional.split('\\n'):\n",
    "    cleaned = cleaning(line)\n",
    "    if len(cleaned) < 3:\n",
    "        continue\n",
    "    c = cleaning(unidecode(line).split('-')[0]).replace('atau', '/').split('/')\n",
    "    \n",
    "    words.extend([cleaning(i) for i in c])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "234"
      ]
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "words = [i for i in words if len(i) > 3]\n",
    "    \n",
    "words = set(words) - malays\n",
    "len(words)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [],
   "source": [
    "import json\n",
    "\n",
    "with open('pahang-words.json', 'w') as fopen:\n",
    "    json.dump(list(words), fopen)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "{'aokme',\n",
       " 'awokme',\n",
       " 'babir',\n",
       " 'baler',\n",
       " 'bederun',\n",
       " 'bejehek',\n",
       " 'bejejet',\n",
       " 'bekeroh',\n",
       " 'beraluih',\n",
       " 'beralus',\n",
       " 'bercemperidei',\n",
       " 'berderau',\n",
       " 'bergodok',\n",
       " 'beringor',\n",
       " 'berjelobei',\n",
       " 'berlemin',\n",
       " 'berlengging',\n",
       " 'berlimbor',\n",
       " 'bersalai',\n",
       " 'bersempudei',\n",
       " 'bertaki',\n",
       " \"berte'eih\",\n",
       " 'bertonyeh',\n",
       " 'beter',\n",
       " 'biroh',\n",
       " 'boleir',\n",
       " 'boleng',\n",
       " 'boyaih',\n",
       " 'buboh',\n",
       " 'caiyor',\n",
       " 'cakner cakna',\n",
       " 'cegeng',\n",
       " 'cenekang',\n",
       " 'cengkelik',\n",
       " 'chika',\n",
       " 'cipot mencipot',\n",
       " 'cokei',\n",
       " 'cokeng',\n",
       " 'condeir',\n",
       " 'congkeh',\n",
       " 'copeir',\n",
       " 'cuok cuak',\n",
       " 'dedeh',\n",
       " 'dedor',\n",
       " 'dema',\n",
       " 'dimeh',\n",
       " 'gamoknye',\n",
       " 'garaih',\n",
       " 'garas',\n",
       " 'gasok',\n",
       " 'gebor',\n",
       " 'genyot',\n",
       " 'getik',\n",
       " 'ghober',\n",
       " 'ghodong',\n",
       " 'godei',\n",
       " 'goge',\n",
       " 'gohek',\n",
       " 'goner',\n",
       " 'gonggot',\n",
       " 'habad',\n",
       " 'habat',\n",
       " 'halkoh',\n",
       " 'hamlau',\n",
       " 'hamlor',\n",
       " 'hampuras',\n",
       " 'hantoi',\n",
       " 'jelong',\n",
       " 'jelun',\n",
       " 'jenih',\n",
       " 'juwei',\n",
       " 'kaih',\n",
       " 'kair',\n",
       " 'kantup',\n",
       " 'kanyo',\n",
       " 'kash',\n",
       " 'kaweh',\n",
       " 'kederat',\n",
       " 'kehem',\n",
       " 'keknya',\n",
       " 'kememe',\n",
       " 'kenikei',\n",
       " 'kepok',\n",
       " 'kerapoh',\n",
       " 'kerayan',\n",
       " 'ketnyer',\n",
       " 'kipong',\n",
       " 'kisok',\n",
       " 'kobek',\n",
       " 'kode',\n",
       " 'kohoit',\n",
       " 'kome',\n",
       " 'komeng',\n",
       " 'komoih',\n",
       " 'konyo',\n",
       " 'kudi',\n",
       " 'kulo',\n",
       " 'kupik',\n",
       " 'kwei kawan',\n",
       " 'lacuh',\n",
       " 'lagung',\n",
       " 'lambo',\n",
       " 'lece',\n",
       " 'lecoh',\n",
       " 'lede',\n",
       " 'ledoit',\n",
       " 'ledot',\n",
       " 'lehet',\n",
       " 'lejut',\n",
       " 'lembang berlembang',\n",
       " 'lempat',\n",
       " 'lempoy belempoy',\n",
       " 'lepe',\n",
       " 'leweh',\n",
       " 'linyo',\n",
       " 'lodek',\n",
       " 'loghat lorat',\n",
       " 'lopok',\n",
       " 'malaih',\n",
       " 'manis meleting',\n",
       " 'mantul',\n",
       " 'masam menaung',\n",
       " 'masam mencekut',\n",
       " 'meghetoh',\n",
       " 'meghuoh meruah',\n",
       " 'megok',\n",
       " 'mek nye matnya',\n",
       " 'melantok',\n",
       " 'melantong',\n",
       " 'melengger',\n",
       " 'melepang',\n",
       " 'meleweh',\n",
       " 'meling',\n",
       " 'melukah',\n",
       " 'membeser',\n",
       " 'membute',\n",
       " 'memetat',\n",
       " 'mencanak',\n",
       " 'mencayak',\n",
       " 'mencelabak',\n",
       " 'menganjing',\n",
       " 'mengaran menajau',\n",
       " 'mengedam',\n",
       " 'mengekot',\n",
       " 'mengelatat',\n",
       " 'mengelentat',\n",
       " 'mengelice',\n",
       " 'mengerebang',\n",
       " 'menggeledeng',\n",
       " 'menginding',\n",
       " 'mengkane',\n",
       " 'mengkone',\n",
       " 'menglekek',\n",
       " 'mengoloh',\n",
       " 'mengopeh',\n",
       " 'mengoteh meroteh',\n",
       " 'menikei',\n",
       " 'meningkoh',\n",
       " 'mentekedaghoh mentekedarah',\n",
       " 'meraban',\n",
       " 'merabung',\n",
       " 'merarau',\n",
       " 'merawei',\n",
       " 'merebang',\n",
       " 'mereloh',\n",
       " 'merening',\n",
       " 'merepau',\n",
       " 'merepih',\n",
       " 'merohong',\n",
       " 'meronoh',\n",
       " 'merukaih',\n",
       " 'merukeh',\n",
       " 'merungkaih',\n",
       " 'merungkeh',\n",
       " 'molor',\n",
       " 'mombong',\n",
       " 'motong',\n",
       " 'muyaih',\n",
       " 'ngercuk',\n",
       " 'ngilir',\n",
       " 'ngonyoh',\n",
       " 'nyayup',\n",
       " 'nyeraya',\n",
       " 'nyuluh',\n",
       " 'ogek',\n",
       " 'oteing',\n",
       " 'palor',\n",
       " 'papalih',\n",
       " \"pedo'oh\",\n",
       " 'pelangkor',\n",
       " 'pepalih',\n",
       " 'pepoh',\n",
       " 'perentan',\n",
       " 'perintan',\n",
       " 'podok',\n",
       " 'podot',\n",
       " 'pundung',\n",
       " 'pungkor',\n",
       " 'ralit',\n",
       " 'rege',\n",
       " 'rengcek ghengchek',\n",
       " 'rengkok ghengkok',\n",
       " 'rhebas',\n",
       " 'sangei',\n",
       " 'sapai',\n",
       " 'sapan',\n",
       " \"se'eh\",\n",
       " 'sebobot',\n",
       " 'sede',\n",
       " 'sekeceng',\n",
       " 'sempelet',\n",
       " 'sengkelen',\n",
       " 'senyour',\n",
       " 'sepan',\n",
       " 'sepolit',\n",
       " 'seronyih',\n",
       " 'sesemut',\n",
       " 'setoho',\n",
       " 'setotok',\n",
       " 'sokmo',\n",
       " 'sontok',\n",
       " 'tatin',\n",
       " 'tawor hebe',\n",
       " 'tebal bakut',\n",
       " 'tekeh',\n",
       " 'tekeih',\n",
       " 'tembe',\n",
       " 'tertomos',\n",
       " 'tetomoih',\n",
       " 'tingkoh',\n",
       " 'waber',\n",
       " 'wokme',\n",
       " 'woreh',\n",
       " 'zaman tori'}"
      ]
     },
     "execution_count": 7,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "words"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.8"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
